#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
__title__ = '根据成长帖地址抓取成长帖所有内容并结构化'
__author__ = 's125_nanoorchis'
__mtime__ = '2017/3/12'
"""
#期望达到的目标：
# 结构化的数据，
# forum_id帖子主人的id，
# floor_no（楼层号）,
# order_no(楼层里面的顺序号)，
# speaker_str(发言人)，
# listener_str（接收人），可能的话这两个也能用相应的forum_id来表示。
# talk_time_date（发言时间）,
# talk_content_
#先使用"../Download/member10/page_1.html"来进行测试

#首先需要得到成长帖有几页，每页地址，一个列表，可以考虑放在pre_table中。
#翻页不太好弄还
from bs4 import BeautifulSoup

def p(str):
    print(str)

soup=BeautifulSoup(open("../Download/member10/page_1.html"),"lxml")
p(soup.prettify())